icon: LiBot
LLM 面试考点
Transformer
数据并行、流水线并行、3D并行、量化、框架【VLLM、DeepSpeed】、tensorRT llm等
Ray(大模型调度推理框架)
模型压缩、知识蒸馏
比较细节的小点?
Post-norm和pre-norm?
大模型幻觉、遗忘的定义?产生原因?不同原因如何解决j?
如何增加context length 模型训练中节约显存的技巧
向量索引、embedding,top几?
主流的embedding有哪些?(看1-2个)
How?
几大模块
特点
方案/系统设计